Expérimentations sur un modèle de recherche d'information utilisant les liens hypertextes des pages Web

نویسندگان

  • Bich-Liên Doan
  • Idir Chibane
چکیده

Résumé. La fonction de correspondance, qui permet de sélectionner et de classer les documents par rapport à une requête est un composant essentiel dans tout système de recherche d'information. Nous proposons de modéliser une fonction de correspondance prenant en compte à la fois le contenu et les liens hypertextes des pages Web. Nous avons expérimenté notre système sur la collection de test TREC-9, et nous concluons que pour certains types de requêtes, inclure le texte ancre associé aux liens hypertextes des pages dans la fonction de similarité s'avère plus efficace.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Modèle de recherche d'information structurée basé sur la relaxation de requêtes

RÉSUMÉ. Cet article présente un modèle pour la recherche d’information sur des documents XML basée sur la comparaison d’arbres, en utilisant le principe de relaxation de requêtes. Les requêtes et les documents sont représentés par des arbres étendus. Un arbre étendu est construit à partir de l’arbre original, avec la pondération des liens virtuels entre chaque nœud et ses descendants indirects,...

متن کامل

Evaluation de la précision pour un système hypertexte

RÉSUMÉ. Certains moteurs de recherche, par exemple Google, utilisent les liens hypertextes dans le processus de sélection des documents en réponse à une requête. Dans ce papier, nous présentons une nouvelle fonction de correspondance qui effectue un classement des réponses à partir d’une mesure d’appariement entre les mots clés d’une requête et le texte ancre associé aux liens hypertextes des p...

متن کامل

Modèle unifié pour la recherche d'information sémantique

Résumé : Un modèle documentaire permet de définir les unités d’indexation (mots, termes, etc.) et de les relier aux documents dans lesquels elles apparaissent. Il permet également de définir les liens entre documents ou portions de documents (ex. citation). Les modèles documentaires sont généralement exploités en recherche d’information pour la représentation des documents et des requêtes et il...

متن کامل

Un modèle de recherche d'information dans des pages Web structurées en blocs

Dans le contexte de la recherche d’information sur le Web, nous présentons ici un modèle pour l’indexation et l’interrogation de pages Web utilisant aussi bien le contenu textuel que leur rendu visuel. Une page Web est considérée comme un ensemble de blocs contenant de l’information multimédia. La représentation visuelle d’un bloc (taille de police, couleur de fond, . . .), ainsi que sa taille ...

متن کامل

Evaluation des performances d'un système de recherche d'information utilisant un algorithme de segmentation thématique de pages Web

In this paper, we explore the use of new page segmentation algorithm using both visual and structural mark-up (,) to partition web pages into blocks and investigate how to take advantage of block-level evidence to improve retrieval performance in the web. We propose a new ranking function that combines content and link rank based on propagation of scores over links on block-to-page grap...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2005